基于現代漢語語法信息詞典的詞語情感評價研究 (Research on Lexical Emotional Evaluation Based on the Grammatical Knowledge-Base of Contemporary Chinese)
نویسندگان
چکیده
This paper introduces the attributes of emotional evaluation in the Grammatical Knowledge-base of Contemporary Chinese. Lexical emotion tagging is studied by means of both qualitative and quantitative approaches. Based on the statistical results from the People’s Daily tagging corpus, lexical emotional trends are described and formulated in our Knowledge-base. Lastly, we also discuss potential applications of emotion tagging in related tasks such as text filtering, information retrieval and web page evaluation. 1 相關研究得到中國國家 973 項目(2004CB318102)和國家 863 計劃(2001AA114210,2002AA117010) 的支持。 ∗ 北京大學計算語言學研究所,100871 中國 Institute of Computational Linguistics, Peking University, 100871 China E-mail: {wangzm, yusw}@pku.edu.cn
منابع مشابه
大規模詞彙語意關係自動標示之初步研究: 以中文詞網(Chinese Wordnet)為例 (A Preliminary Study on Large-scale Automatic Labeling of Lexical Semantic Relations: A Case study of Chinese Wordnet) [In Chinese]
近年來, 以知識資源為本的自然處理技術已成為一種重要的研究取向。 對於各種詞彙語意資源之建構, 包括電子辭典 (Lexicon)、 同義詞詞林 (Thesaurus)、 詞彙網路 (WordNet), 甚至知識本體 (ontologies), 已成為一個不可 抵擋的趨勢。 其中, 詞彙網路是在計算語言學相關領域中, 目前最為普遍利 用之一項詞彙語意資源。 然而, 詞彙網路之建構是一項耗時費力之基礎工程。 對於世界上許多使 用頻度不高的語言而言, 更是一項艱鉅之任務。 本文提出一個借力於普林斯 頓英語詞網 (Princeton WordNet) 與歐語詞網 (EuroWordNet) 之 bootstrapping 方法, 應用在正在發展的中文詞網詞彙語意關係之自動標記工作上。 實 驗的結果與初步評估證明, 此法對於詞網建構是一個相當可行的方式。
متن کاملA Study of Words of the “Ge” Type in the Chinese Dialects
「箇」的量詞用法存在於現代漢語各方言區,其指代詞和相當於「的1、的2、的 3」的結構助詞用法,則存在於南方的漢語方言以及相鄰的少數官話方言點中。指代 詞「箇1」的次類複雜,在江淮官話黃孝片是所指不分遠近的定指詞,在贛語、湘 語、徽語區主要演變為近指代詞,在粵語區、閩語中的個別地方主要演變為遠指代 詞,在客家話和相鄰的部分贛語中分化為遠指代詞和近指代詞;在吳語區以演變為 近指代詞為主,其他各類指代詞都有一定的存在面。「箇1」由定指詞向各類指示代 詞的演變,基本上是在長江以南分別成片進行的,表現出「大集中、小分散」的格 局,吳語區則反映出定指詞與中性、近指、遠指代詞並存的局面。在指代詞「箇1」 分佈的各方言區以及平話中,大都存在相當於「的3」的結構助詞「箇3」;在「箇 1」用作定指詞、近指代詞的贛語、湘語、吳語、客家話的部分方言中,則存在相當 於「的1、的2」的結構助詞「箇2」。「箇類詞...
متن کامل漢語動詞辭彙語義分析:表達模式與研究方法 (A Lexical-Semantic Analysis of Mandarin Chinese Verbs: Representation and Methodology)
在這篇文章中我們將簡單扼要地介紹詞庫小組分析動詞語意的作法,包含了理 論部分以及分析的方法和步驟。這套理論架構是從實際分析的過程中逐漸形成 的,但尚未完全成熟。截至目前為止,我們已經分析了四十多組近義動詞和近 十組動詞語意場,並初步架構了一套由語意屬性組成的動詞語意表達模式。這 套理論和分析方法是建立在詞庫小組十幾年的研究基礎上,結合了眾人的力量 逐步完成的。 本文嘗試統合眾人的研究所得,設法銜接理論與語言事實,並詳細介紹我 們的研究方法。關於理論部分,詞庫小組已發表了許多篇論文。早期架構請參 考 Tsai 等人[1998]、Huang 等人[1998],最近的架構請參考 Huang 等人[見本期 刊]。這些論文側重理論架構在學理上的探討,對語言事實涉及較少。本文則 採用較多的語料,設法將理論落實。此外,詞庫小組也發表多篇論文探討了幾 個特定近義詞組或語意場,像是 Chang 等人[...
متن کامل以語料為基礎的中文語篇連貫關係自動標記 (Corpus-Based Coherence Relation Tagging in Chinese Discourse) [In Chinese]
近年來, 以知識資源為本的自然處理技術已成為一種重要的研究取向。對於各種詞彙語意資源之建構, 包括電子辭典 (Lexicon)、 同義詞詞林 (The-saurus)、 詞彙網路 (WordNet), 甚至知識本體 (ontologies), 已成為一個不可抵擋的趨勢。其中, 詞彙網路是在計算語言學相關領域中, 目前最為普遍利用之一項詞彙語意資源。然而, 詞彙網路之建構是一項耗時費力之基礎工程。 對於世界上許多使用頻度不高的語言而言, 更是一項艱鉅之任務。 本文提出一個借力於普林斯頓英語詞網(Princeton WordNet) 與歐語詞網 (EuroWordNet) 之 bootstrap-ping 方法, 應用在正在發展的中文詞網詞彙語意關係之自動標記工作上。 實驗的結果與初步評估證明, 此法...
متن کامل信息處理用現代漢語虛詞義類詞典研究和工作單設計 (Study on the Machine Tractable Thesaurus Dictionary of Contemporary Chinese Functional Words for Information Processing and Design Information Terms for Dictionary Entries)
At present, worldwide scholars from different countries attach great importance to the knowledge resource construction of language information processing. Knowledge includes the aspects of lexicology, syntax, semantics, pragmatics and even general knowledge. The knowledge of semantics is the core, of which the most basic and most important one is the semantic knowledge of vocabulary. During the...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- IJCLCLP
دوره 10 شماره
صفحات -
تاریخ انتشار 2005